مدلی برای تحلیل و تولید متن وبلاگ فارسی

پایان نامه
چکیده

هدف از این پروژه استفاده از پیکره ی متنی وبلاگ های فارسی برای استخراج اطلاعات زبان شناختی و یافتن مدلی برای تولید خودکار متن فارسی است. مهم ترین ابزار مورد نیاز برای حل مسایل مختلف به روش تجربی در حیطه ی پردازش زبان طبیعی وجود پیکره ی زبانی بزرگ و متعادل است در زبان فارسی با رشد کمی وبلاگ های فارسی در سال های اخیر چنین پیکره ی متنی بزرگی در وجود دارد. این پیکره با اینکه خصوصیات یک پیکره ی متعادل را ندارد. اما ویژگی هایی دارد که آن را برای تحلیل زبان شناختی مناسب می کند. برای اینکه پیکره ی بسیار ناهمگن وبلاگ های فارسی را که در زمان ها و موقعیت های مختلف نوشته شده و نویسنده های متعدد دارد. تبدیل به پیکره ی مناسبی برای پردازش ماشینی کنیم روی آن انواعی از پیش پردازش ها انجام می دهیم و سپس با روش های مختلف آماری ویژگی های زبان شناختی آن را بررسی می کنیم. در پایان مدلی برای تولید خودکار متن مشابه پیشنهاد می کنیم و نتایج حاصل از تولید خودکار متن را ارزیابی می کنیم

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

ساختار وبلاگهای فارسی روزنامه نگاری تحلیل محتوای وبلاگ های فارسی روزنامه نگاران ایرانی

وبلاگ فرم خاصی از وبسایت است که به طور متناوب به روز می شود و در آن مطالب به ترتیب تاریخ مرتب می شوند. این فرم ساده و انعطاف پذیر، وبلاگ را به رسانه ای با پتانسیل بالا برای استفاده های شخصی و حرفهای تبدیل کرده است. مهم تر از همه، فضایی را در اختیار مردم قرار می دهد تا بتوانند جهان را آنگونه که می بینند بیان کنند. این پژوهش تلاش می کند تصویری از چیستی وبلاگ و ساختار و محتوای آن ارائه دهد. ضمن آن...

متن کامل

تحلیل محتوا وبلاگ های عکاسی فارسی ایران

چکیده این پایان نامه با هدف تحلیل محتوای وبلاگ های عکاسی فارسی انجام پذیرفته شده است. در این پژوهش کوشش نموده ایم محتوای وبلاگ های عکاسی فارسی را در زمینه های همچون آموزش ، نقد و تحلیل آثار عکاسی ، معرفی رویکرد ها و ابزار های جدید عکاسی مورد ارزیابی قرار دهیم. در این پایان نامه مفاهیم کلیدی مانند اطلاعاتی شدن، دیجیتالی شدن و رسانه ای شدن جامعه را که منجر به پیدایش وبلاگ شده است را تبیین نمود...

وابستگی درونی میان فرآیند و تولید متن خوانداری در انگلیسی و فارسی

در حالیکه این واقعیت که خواندن در زبان دوم امر دشواری برای اغلب زبان آموزان انگلیسی است، در ادبیات تحقیق بخوبی منعکس شده است، اما با این وجود هنوز این مسئله روشن نیست که این دشواری از مشکل یادگیری زبان ناشی می شود و یا دشواری درخواندن. "خواندن در زبان خارجی: یک مشکل خواندن و یا یک مشکل یادگیری است؟"(الدرسون ۱۹۸۴). در اینجا" مشکل زبانی" به ضعف در دانش و مهارتهای مورد نیاز برای پردازش مشخصه های ز...

متن کامل

ارائه مدلی برای تحلیل محتوای سیاست‌های فرهنگی

این مقاله، بر آن است که مدلی برای تحلیل محتوای سیاست‌های فرهنگی بدست دهد. منظور از سیاست‌های فرهنگی در این مقاله به طور خاص سیاست‌هایی است که از جانب دولت به صورت مکتوب و مصوب ارائه می‌شود تا زمینه‌ای برای مدیریت فرهنگی (برنامه‌ریزی و سازماندهی و هدایت منابع و نیروها) باشد. مدل باید به دنبال پیدا کردن عقلانیت حاکم بر سیاست فرهنگی باشد. به منظور دستیابی به این مدل، ضمن مطالعه ادبیات موضوع به مس...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023